انتخاب نظارتی و غیرنظارتی متغیرهای حاوی اطلاعات بر اساس روش جک-نایف

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده شیمی
  • نویسنده سعید باقری
  • استاد راهنما محسن کمپانی زارع
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1392
چکیده

بخش اول این بخش در ابتدا با توصیف روش spa و نشان دادن میزان عملکرد آن در انتخاب متغیرهای مورد نظر و مناسب جهت مدل¬سازی شروع می¬شود. ضعف¬های موجود در این روش مورد بررسی قرار می¬گیرد و نشان داده می¬شود که روش spa به تنهایی قادر به انتخاب مجموعه¬ای از بهترین متغیرها برای مدل¬سازی سیستم نمی¬باشد. سپس به بررسی روش cwspa به عنوان اصلاحیه¬ی صورت گرفته بر روش spa پرداخته می-شود. در این روش از میزان همبستگی میان متغیرهای مستقل و متغیر وابسته به عنوان معیار موثر در فرایند انتخاب spa شده¬است. اما نتایج نشان می¬دهد که انتخاب تاثیر گرفته از همبستگی میان متغیرهای مستقل و وابسته در روش spa با اصل اولیه¬ی روش spa (متغیرهایی با کمترین وابستگی خطی به یکدیگر) تفاوت دارد. از این رو در این پژوهش پیشنهاد شد تا از میزان تاثیر هر متغیر مستقل در پیش¬بینی متغیر وابسته¬ی مربوطه به عنوان یک عامل اصلاحی در فرایند spa استفاده شود تا متغیرهای انتخاب¬شده هم باعث تاثیر مثبت در پیش¬بینی متغیر وابسته باشند و هم کمترین وابستگی خطی در بین آن¬ها دیده شود. نتایج بدست¬آمده از بکارگیری این روش بر روی 3 داده¬ی مختلف به خوبی نشان داد که روش پیشنهاد شده توانسته با تعداد متغیر بسیار کم (کمتر از 5 متغیر مستقل) مدل¬هایی با کیفیت پیش¬بینی بسیار بالا ( q2 > 0.85 ) و وابستگی بسیار کم در بین متغیرهای انتخاب¬شده ارائه کند. بخش دوم این بخش شکلی دیگر از انتخاب متغیر را بررسی می¬کند که هدف آن انتخاب متغیرهایی است که بیشترین سهم اطلاعاتی موجود در ماتریس داده¬ها (متغیرهای مستقل) را شامل می¬شوند و همچنین توانایی بالایی در توصیف متغیر وابسته دارند. به این منظور در ابتدا برای جلوگیری از ورود متغیرهای حاوی اطلاعات مشابه به مدل¬سازی، متغیرها با روش گرم-اشمیت بر هم عمود می¬شوند. از روش جک¬نایف نیز به منظور جلوگیری از ورود متغیرهایی که ناپایداری زیادی در ضریب رگرسیون خود دارند استفاده می¬شود. و در نهایت آن سری از متغیرهایی که بتوانند ماتریس امتیاز را به خوبی توصیف کنند انتخاب می¬شوند. در نهایت دیده می¬شود که روش بکار گرفته توانسته به خوبی متغیر وابسته را توصیف کند. نتیجه کلی بدست¬آمده در این بخش روشی است که متغیر وابسته در انتخاب متغیرها هیچ دخالتی (غیرنظارتی) نداشته¬است. از این روش می¬توان برای پیش¬بینی فعالیت و خواص چندین مولکول که یک ساختار کلی را شامل می¬شوند استفاده کرد. با استفاده از این روش 8 متغیر برای داده¬ی hiv انتخاب شد که قدرت پیش¬بینی خوبی ( q2 > 0.80 ) را با توجه به غیرنظارتی بودن روش از خود نشان¬داد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

براورد واریانس به روش جک نایف در آمارگیری های دوچارچوبی

روش های معمول براورد واریانس از قبیل روش خطی سازی سری تیلور (روش دلتا)۱ در آمارگیری های چندچارچوبی۲ عموماً مستلزم محاسبه ی مشتق های جزئی بوده و این محاسبات با افزایش تعداد چارچوب ها پیچیده تر می شود. براورد واریانس به روش جک نایف۳ روش دیگری است که ضمن سهولت در محاسبه، موجب کاهش چشم­گیری در اریبی براوردگر می شود. در این مقاله ابتدا به معرفی براوردگرهای چندچارچوبی مجموع جامعه و سپس استفاده از روش ...

متن کامل

روش‌های بازنمونه‌گیری بوت استرپ و جک نایف در تحلیل بقای بیماران مبتلا به تالاسمی ماژور

Background and Objectives: A small sample size can influence the results of statistical analysis. A reduction in the sample size may happen due to different reasons, such as loss of information, i.e. existing missing value in some variables. This study aimed to apply bootstrap and jackknife resampling methods in survival analysis of thalassemia major patients. Methods: In this historical coh...

متن کامل

بررسی رفتار برآوردگر جک نایف ریج

هنگامی که همخطی بین ستون های ماتریس طرح در رگرسیون خطی وجود دارد، استفاده از روش کمترین توان های دوم در برآورد ضرایب مدل، معمولاً باعث می شود که برآوردهای خیلی ضعیفی به دست آید. ثابت شده است که واریانس برآوردگرهای کمترین توان های دوم ضرایب رگرسیون ممکن است در حد قابل توجهی افزایش یابند و طول بردار برآورد کمترین توان های دوم پارامتر به طور متوسط خیلی زیاد می شود. در این راستا، یکی از راه های رفع ...

15 صفحه اول

کاربرد شاخص های عددی ریرفکشن و جک نایف در ارزیابی غنای گونهای جنگل های بلوط

به ‌منظور بررسی کاربرد روش‌های عددی ریرفکشن و جک‌نایف درارزیابی غنای گونه‌ای جنگل‌های بلوط بانه استان کردستان، سه منطقه کمتردست‌خورده، تخریب متوسط و تخریب شدید انتخاب شدند. 3 قطعه جنگلی با شرایط فیزیوگرافی مشابه از هر منطقه انتخاب و در هر قطعه، 3 پلات 400 مترمربعی (برروی ترانسکت و در فاصله 100 متری) جهت برداشت اطلاعات فلورستیک پیاده شدند. در هر قطعه ‌‌نمونه نوع و فراوانی گونه‌های علفی در 5 میکر...

متن کامل

آزمون نیکویی برازش بر اساس نسبت درستنمایی تجربی جک نایف شده

برای انتخاب آزمون درست برای تحلیل فرضیه ها،ابتداباید از توزیع آماریجامعه ای که مورد آزمون قرار می گیرد، اطمینان حاصل کرد. برای نمونه، پیش نیاز آزمون های پارامتری، نرمال بودنتوزیع آماری متغیرهاست. به طور کلی می توان گفت که آزمون های پارامتری، عموما بر میانگین و انحراف معیار استوارند. حال اگر توزیع جامعه نرمال نباشد، نمی توان استنباط درستی از نتایج داشت. برای بررسی توزیع آماریجامعه از آزمون هایی ...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده شیمی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023